Futuro de las CPUs con NPU integrada

La NPU prácticamente acaba de llegar, pese a eso, dada la importancia creciente de las cargas de IA, ahora prácticamente está presente en muchas CPUs integrada o en muchos SoCs. Si te estás preguntando qué depara el futuro para este tándem de unidades, aquí echamos una mirada a cómo la NPU poco a poco restará protagonismo incluso a la CPU…

Índice de contenidos

Te puede interesar leer sobre cómo saber si tu PC tiene NPU

Arquitectura híbrida

Durante décadas, la CPU ha sido el núcleo central de procesamiento, encargada de ejecutar instrucciones secuenciales y coordinar el funcionamiento del sistema. Poco a poco se fue complementando con otras soluciones como la FPU o coprocesador matemático, que era opcional. Con la llegada de los primeros aceleradores gráficos o GPUs, se introdujo el procesamiento paralelo masivo, ideal para tareas gráficas y, más recientemente, para entrenamiento de modelos de IA.

Las NPUs, en cambio, están diseñadas específicamente para ejecutar inferencias de redes neuronales de forma eficiente, con una arquitectura optimizada para operaciones matriciales y convolucionales. Por tanto, son aceleradores ideales para cargas de IA.

La tendencia actual apunta a una descentralización del cómputo, lo que tantas veces hemos llamado computación heterogénea, donde la CPU ya no es el único actor relevante. En los SoCs modernos como los Apple A-Seires y M-Series, Intel Core Ultra, AMD Ryzen o Qualcomm Snapdragon, la NPU comienza a asumir tareas que antes recaían en la CPU o GPU, como el reconocimiento de voz, la traducción en tiempo real, la clasificación de imágenes y la ejecución de asistentes virtuales…

Relevancia creciente de la NPU en el silicio

La integración de NPUs en CPUs no es meramente simbólica. Según estimaciones de Intel, para 2028 más del 80% de los PCs incluirán capacidades avanzadas de IA gracias a la NPU. Este dato refleja una tendencia clara: la NPU está dejando de ser un coprocesador accesorio para convertirse en un componente esencial.

Desde el punto de vista físico, esto implica una redistribución del área de silicio. En los diseños más recientes, la NPU ocupa una porción cada vez mayor del die, desplazando espacio que antes se destinaba a núcleos de propósito general. Esta evolución responde a la demanda de ejecutar modelos de IA localmente, sin depender de la nube, lo que reduce la latencia, mejora la privacidad y optimiza el consumo energético.

Sin embargo, el problema es que eso supondrá chips más caros y la dependencia cada vez mayor de las tecnologías de empaquetado 2.5D y 3D… Y no solo eso, la unidad se volverá más compleja, demandando más ports y líneas de bus para mejorar el ancho de banda para alimentar a la NPU con los datos necesarios desde la memoria.

Retos técnicos y arquitectónicos

No obstante, aún hay muchos retos por superar, aunque la IA marcha constante y sin pausa, como todos podemos ver:

Compatibilidad de software: no todos los modelos de IA están optimizados para ejecutarse en NPUs. La falta de estandarización en APIs y frameworks puede limitar la adopción masiva.
Gestión térmica: a medida que la NPU gana protagonismo, su consumo energético y generación de calor aumentan. Esto exige soluciones avanzadas de refrigeración y distribución térmica.
Seguridad y privacidad: ejecutar IA localmente implica procesar datos sensibles en el dispositivo. Las NPUs deben incorporar mecanismos de protección contra ataques de canal lateral y manipulación de modelos.
Balance de recursos: determinar qué tareas deben ejecutarse en la CPU, GPU o NPU requiere algoritmos de orquestación inteligentes que maximicen el rendimiento sin desperdiciar recursos.

¿Desplazamiento funcional de la CPU?

arquitectura GPU, gpu, tipos de arquitectura — NVIDIA Pascal

Una de las preguntas que se hacen muchos usuarios en este escenario es si la CPU podría perder protagonismo frente a la NPU. Aunque la CPU seguirá siendo indispensable para tareas generales, su papel como ejecutor de cargas de trabajo intensivas podría verse limitado. Las NPUs están diseñadas para ejecutar inferencias con una eficiencia energética y velocidad que la CPU no puede igualar. En aplicaciones como asistentes personales, análisis de imágenes médicas, o sistemas de recomendación, la NPU ya supera a la CPU en rendimiento por vatio.

Además, los avances en compiladores y frameworks de IA están facilitando la migración de cargas de trabajo hacia la NPU. Herramientas como ONNX Runtime, TensorFlow Lite y Apple Core ML permiten que los modelos se ejecuten directamente en la NPU, sin intervención de la CPU. Esto sugiere que, en ciertos contextos, la CPU podría convertirse en un coordinador de tareas más que en un procesador activo.

Nuevas arquitecturas emergentes

El auge de las NPUs está impulsando el desarrollo de arquitecturas híbridas y heterogéneas. En lugar de una CPU monolítica, los sistemas tienden hacia diseños modulares con múltiples unidades especializadas. Al igual que con las GPUs, en las que vemos iGPU y dGPU, con la NPU pasará algo similar, donde tendremos futuros equipos con iNPU y también con NPU discreta o dedicada, ya sea en un chip aparte o en una tarjeta de expansión como ahora están las tarjetas gráficas. Sin ir más lejos, AMD sorprendió recientemente con un anuncio en el que aseguraba que estaba explorando este tipo de NPUs discretas.

Ejemplos notables incluyen:

SoCs con NPU dedicada: como los chips de Apple, Qualcomm y MediaTek, que integran NPUs con acceso directo a memoria compartida.
Chiplets y empaquetado 3D: tecnologías como Foveros de Intel permiten combinar CPU, GPU y NPU en un mismo paquete, optimizando la interconexión y la latencia.
Edge AI accelerators: dispositivos como los Coral Edge TPU de Google o los Hailo AI chips están diseñados exclusivamente para inferencia local, sin CPU tradicional.

También te puede interesar conocer qué es una vNPU

Implicaciones para desarrolladores y fabricantes

La proliferación de NPUs redefine el desarrollo de software y de los drivers o controladores para los sistemas operativos, y por tanto también la de los compiladores. Los programadores deben aprender a diseñar aplicaciones que aprovechen la inferencia local, optimizar modelos para hardware específico y gestionar la distribución de tareas entre unidades. Esto requiere nuevas herramientas, lenguajes y paradigmas de programación. Por su parte, las empresas como Intel, AMD, Apple, Qualcomm, NVIDIA, etc., también deberán aportar plataformas de desarrollo y documentación para facilitar el soporte de sus NPUs.

¿Un futuro sin CPU?

Aunque es improbable que la CPU desaparezca, su rol podría transformarse radicalmente. En escenarios donde la IA domina la interacción con el usuario, la NPU podría asumir el control operativo. La CPU quedaría relegada a tareas menos importantes.

Incluso en entornos empresariales, la tendencia hacia AI-native computing podría reducir la dependencia de CPUs tradicionales. Los centros de datos ya están adoptando aceleradores de IA como los TPUs de Google, AMD Instinct, o los H-Series de NVIDIA, que minimizan el uso de CPU en favor de unidades especializadas…

Por ejemplo, en la actualidad, imagina que tienes un equipo Windows 11 con SoC Qualcomm Snapdragon X Elite, que incluye tanto núcleos de CPU como de NPU y quieres ejecutar Copilot localmente. En este caso, la CPU también tendría su papel importante, ya que se encargaría de:

Coordinación del sistema: la CPU coordina la interacción entre la NPU, la memoria, el sistema operativo, como los drivers necesarios, syscalls, y otros componentes. También decide cuándo y cómo delegar tareas a la NPU, especialmente en flujos mixtos donde hay partes que no pueden acelerarse por hardware.
Preprocesamiento y postprocesamiento: antes de que un modelo de IA se ejecute en la NPU, la CPU puede encargarse de preparar los datos. Después de la inferencia, la CPU interpreta los resultados, los integra en la interfaz de usuario y gestiona la respuesta.
Gestión de entrada/salida: la CPU maneja eventos como pulsaciones de teclado, clics, comandos de voz, y los traduce en instrucciones que activan la NPU. También gestiona la visualización de resultados, actualizaciones en pantalla y comunicación con otros programas.
Tareas no acelerables por NPU: algunas operaciones lógicas, de red, o de seguridad no están optimizadas para NPUs y siguen ejecutándose en la CPU. Por ejemplo, la verificación de permisos, cifrado de datos, o acceso a archivos locales.
Fallback y compatibilidad: si la NPU no soporta ciertos operadores del modelo o no alcanza el rendimiento necesario, la CPU puede asumir parte del procesamiento, e incluso la GPU si hiciese falta. Esto garantiza que Copilot siga funcionando, aunque con menor eficiencia.

Deja tus comentarios o dudas…

Isaac8 septiembre, 2025

5 minutos de lectura aproximada.